智能论文笔记

Teaching CNNs to mimic Human Visual Cognitive Process & regularise Texture-Shape bias

Satyam Mohla , Anshul Nasery , Biplab Banerjee

分类：计算机视觉 | 人工智能 | 机器学习

2020-06-25

最近在计算机视觉中的实验证明了纹理偏见，作为采用卷积神经网络（CNNS）模型的最高结果的主要原因，与早期作品相冲突，声称这些网络使用形状识别对象。据信，成本函数迫使CNN采取贪婪的方法，并为纹理等本地信息制定倾向，以提高准确性，从而无法探索任何全局统计数据。我们提出了一种新的直观架构，这是一种新的直观架构，灵感来自心理学中的特征整合理论，利用人类的可解释特征，如形状，纹理，边缘等。重构，并对图像进行分类。我们定义了新颖的指标，以使用注意图量化这些模式中存在的“抽象信息”的“相关性”。我们进一步介绍了一个正则化方法，该方法可确保形状，纹理等的每个模式在给定的任务中都会对其进行比例影响，因为它可以重建;并且，除了赋予这些CNN的解释性以实现对象识别的卓越性能之外，执行实验以表明所得到的精度和鲁棒性。

translated by 谷歌翻译

Application of Causal Inference to Analytical Customer Relationship Management in Banking and Insurance

Satyam Kumar , Vadlamani Ravi

分类：机器学习 | 人工智能

2022-08-19

最近，为了在各个领域之间具有更好的可接受性，研究人员认为，机器智能算法必须能够提供人类可以在因果关系中理解的解释。这一方面也称为可控性，可以达到特定水平的人类水平解释性。一种称为反事实的特定算法可能能够提供可有效性。在统计数据中，因果关系已被研究和应用多年，但在人工智能（AI）方面尚未详细介绍。在首次研究的研究中，我们采用了因果推理的原则来提供解释性来解决分析客户关系管理（ACRM）问题。在银行和保险的背景下，有关解释性的当前研究试图解决与因果关系有关的问题，例如为什么该模型做出这样的决定，并且该模型的选择是否受到特定因素的影响？我们提出了一种以干预形式的解决方案，其中研究了目标特征的ACRM数据集特征分布的效果。随后，还获得了一套反事实，可以向任何需要解释银行/保险公司做出的决定的客户提供。除了信用卡流失预测数据集外，还为贷款默认，保险欺诈检测和信用卡欺诈检测数据集生成了高质量的反事实，其中观察到不超过三个功能的变化。

translated by 谷歌翻译

Explainable Reinforcement Learning on Financial Stock Trading using SHAP

Satyam Kumar , Mendhikar Vishal , Vadlamani Ravi

分类：人工智能

2022-08-18

近年来，可解释的人工智能（XAI）研究因对用户社区对AI的更高透明度和信任的需求而获得了突出性。这尤其重要，因为AI在金融，医学等敏感领域采用，在这种敏感领域，对社会，道德和安全的影响是巨大的。经过彻底的系统评估，XAI的工作主要集中于机器学习（ML）进行分类，决策或行动。据我们所知，没有任何据报道提供可解释的加固学习（XRL）方法来交易金融股票的方法。在本文中，我们提议在流行的深层增强学习体系结构，深Q网络（DQN）上采用Shapley添加说明（SHAP），以解释代理商在给定实例中在金融股票交易中的行动。为了证明我们方法的有效性，我们在两个流行的数据集（即Sensex和DJIA）上对其进行了测试，并报告了结果。

translated by 谷歌翻译

Explainable Deep Belief Network based Auto encoder using novel Extended Garson Algorithm

Satyam Kumar , Vadlamani Ravi

分类：机器学习 | 人工智能

2022-07-18

机器学习中最困难的任务是解释训练有素的浅神经网络。深度神经网络（DNNS）为更多的任务提供了令人印象深刻的结果，但是通常不清楚这种训练有素的深神经网络如何做出决策。提供特征重要性是浅层神经网络中使用的最重要和流行的解释技术。在本文中，我们开发了一种算法，扩展了Garson算法的思想，以解释基于信念网络的自动编码器（DBNA）。它用于确定DBN中每个输入特征的贡献。它可用于具有许多隐藏层的任何神经网络。该方法的有效性在分类和从文献中获取的回归数据集进行了测试。将此方法鉴定出的重要特征与Wald Chi Square（\ c {hi} 2）获得的特征进行了比较。对于4个分类数据集中的2个和5个回归数据集中的2个，我们提出的方法导致识别更好质量的特征，从而导致统计上更重要的结果，相对于wald \ c {hi} 2。

translated by 谷歌翻译

Alexa Teacher Model: Pretraining and Distilling Multi-Billion-Parameter Encoders for Natural Language Understanding Systems

Jack FitzGerald , Shankar Ananthakrishnan , Konstantine Arkoudas , Davide Bernardi , Abhishek Bhagia , Claudio Delli Bovi , Jin Cao , Rakesh Chada , Amit Chauhan , Luoxin Chen

分类：自然语言处理 | 人工智能 | 机器学习

2022-06-15

我们介绍了一个大规模实验，该实验对编码器进行了预处理，其参数计数范围从700m到9.3b不等，随后蒸馏到较小的型号中，范围为17m-170亿参数，其应用到自然语言理解（NLU）组件（NLU）组件（虚拟助手系统。尽管我们使用70％的口语数据训练，但在对书面形式的跨语性自然语言推论（XNLI）语料库进行评估时，我们的教师模型与XLM-R和MT5相当。我们使用系统中的内域数据对教师模型进行了第二阶段的训练，以提高了3.86％的相对分类，而相对7.01％的插槽填充。我们发现，即使是从我们的2阶段教师模型中提取的170亿参数模型，与仅接受公共数据的2.3B参数老师相比，与2.3B参数老师相比，意图分类更好2.88％，并且7.69％的插槽填充错误率更好（第1阶段），强调了。内域数据对训练的重要性。当使用标记的NLU数据进行离线评估时，我们的17m参数阶段2蒸馏模型的表现分别优于XLM-R碱基（85m Params）和Distillbert（42m Params），分别优于4.23％至6.14％。最后，我们介绍了一个完整的虚拟助手实验平台的结果，在该平台中，我们发现使用经过预训练和蒸馏管道训练的模型超过了从8500万参数教师蒸馏的模型，在自动测量全系统用户不满的自动测量中，从8500万参数教师蒸馏出3.74％-4.91％。

translated by 谷歌翻译